Ⅵ-2.2 ★ 두 번째 측도 9수05-05 2022 개정 교육과정

같은 평균, 다른 모습
퍼짐의 정도

두 자료의 평균이 같다고 해서 두 자료가 같은 것은 아니다. 한 무더기는 모두 평균 근처에 모여 있고, 다른 무더기는 멀리 흩어져 있다. 얼마나 흩어졌는가를 한 수로 표현한 것이 분산과 표준편차다.

01같은 평균, 다른 분포

Same mean, different spread
"두 반의 평균 점수가 모두 $75$ 점. 그럼 두 반의 실력이 같은가?"
반 A: 모두 70~80점 사이. 반 B: 50~100점 사이. 평균은 같지만 전혀 다른 반. 평균만으로는 자료의 모습을 완전히 알 수 없다. 자료가 평균에서 얼마나 흩어졌는지 — 그 정도를 측정해야 한다. 분산표준편차가 답.
평균 반 A · 좁은 분포 반 B · 넓은 분포 · 같은 평균

02편차에서 분산까지 — 핵심 개념

From deviation to variance
개념 ①

편차 Deviation

$d_i = x_i - \bar{x}$

각 자료가 평균에서 얼마나 떨어졌는지. 양수면 평균보다 큼, 음수면 작음, 0이면 평균과 같음.

핵심 사실: 편차들의 합은 항상 0. $\sum(x_i - \bar{x}) = 0$. 이 때문에 편차의 단순 평균은 0이 되어 — 흩어짐의 척도로 쓸 수 없다.

개념 ②

분산 Variance $s^2$

$\displaystyle s^2 = \dfrac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2$

편차를 제곱하고 평균을 낸 것. 음수가 사라져서 합쳐도 0이 되지 않는다.

단위: 자료가 cm라면 분산은 cm². 그래서 원래 단위로 돌아오기 위해 제곱근을 취한다.

개념 ③

표준편차 Standard Deviation $s$

$s = \sqrt{s^2} = \sqrt{\dfrac{1}{n}\sum(x_i - \bar{x})^2}$

분산의 제곱근. 단위가 자료와 같아져서 직접 비교 가능.

"자료가 평균에서 평균적으로 얼마나 떨어져 있는가"의 척도. 작을수록 자료가 평균 주위에 모여 있고, 클수록 흩어져 있다.

개념 ④

편차의 합 = 0 증명

$\sum(x_i - \bar{x}) = \sum x_i - n\bar{x} = n\bar{x} - n\bar{x} = 0$

$\bar{x} = \tfrac{1}{n}\sum x_i$ 의 정의에서 즉시. 따라서 평균은 "편차의 합을 0으로 만드는 유일한 값". 자료의 균형점.

034단계 계산 절차

4-step procedure

분산·표준편차를 구하는 표준 절차

  1. STEP 1 · 평균 구하기

    $\bar{x} = \dfrac{1}{n}\sum x_i$. 모든 자료를 더해 개수로 나눈다.

  2. STEP 2 · 편차 계산

    각 자료 $x_i$ 에 대해 편차 $x_i - \bar{x}$ 를 구한다. (체크: 편차의 합이 0이 되어야 함.)

  3. STEP 3 · 편차의 제곱의 합

    각 편차를 제곱한 뒤 모두 더한다: $\sum(x_i - \bar{x})^2$.

  4. STEP 4 · 분산과 표준편차

    분산 $s^2 = $ 위 합을 $n$ 으로 나눈 값. 표준편차 $s = \sqrt{s^2}$.

04예시 풀이 — 자료 $1, 3, 5, 7, 9$

Worked walk-through

5개 자료의 분산과 표준편차

DATA · 1, 3, 5, 7, 9 (n = 5)

STEP 1 · 평균 $\bar{x} = \dfrac{1+3+5+7+9}{5} = \dfrac{25}{5} = 5$.

STEP 2 · 3 · 표로 정리:

$x_i$편차 $x_i - \bar{x}$편차의 제곱 $(x_i-\bar{x})^2$
1−416
3−24
500
724
9416
0 ✓40

STEP 4 · 분산 $s^2 = \dfrac{40}{5} = 8$. 표준편차 $s = \sqrt{8} = 2\sqrt{2} \approx 2.83$.

분산 $s^2 = 8$ · 표준편차 $s = 2\sqrt{2}$

05두 자료 비교 — 같은 평균, 다른 분산

Same mean, different variance

조밀한 자료 X

$7, 8, 9, 10, 11$
평균 = 9
편차 제곱 합 = $4+1+0+1+4 = 10$
분산 = $\tfrac{10}{5} = 2$
표준편차 = $\sqrt{2} \approx 1.41$

흩어진 자료 Y

$3, 6, 9, 12, 15$
평균 = 9 (X와 동일)
편차 제곱 합 = $36+9+0+9+36 = 90$
분산 = $\tfrac{90}{5} = 18$
표준편차 = $\sqrt{18} = 3\sqrt{2} \approx 4.24$

관찰  자료 Y의 표준편차 $3\sqrt{2}$ 는 X의 $\sqrt{2}$ 의 3배. 자료 Y의 값들이 평균에서 3배 더 떨어져 있다. 평균은 같지만 자료의 모습은 전혀 다르다 — 분산·표준편차가 이 차이를 정량적으로 보여준다.

06왜 제곱하는가

Why squaring deviations?

왜 절댓값이 아닌 제곱?

"편차의 평균이 흩어짐의 측도가 될 수 없다면, 절댓값을 평균내면 되지 않나?" — 충분히 합리적인 질문. 실제로 그것을 평균 절대 편차 (MAD) 라 부르고 통계에서 사용한다. 하지만 분산을 표준으로 쓰는 이유:

① 매끄러운 함수 · 제곱은 미분 가능하지만 절댓값은 0에서 미분 불가. 분산 기반 통계 이론이 수학적으로 다루기 훨씬 쉽다.
② 큰 편차 강조 · 제곱은 큰 편차를 더 크게 만든다. 이상치의 영향을 분산에 더 반영 — 흩어짐을 더 정직하게 표현.
③ 자연스러운 거리 · 피타고라스 정리에서 $d^2 = x^2 + y^2$. 다차원 데이터에서 거리의 본질이 제곱의 합. 분산은 그 연장선.
④ 정규분포와의 결합 · Gauss가 발견한 정규분포는 분산 $\sigma^2$ 한 수로 완전히 결정. 다른 측도로는 이런 우아함이 없다.

결국 — 수학적 우아함과 실용성의 균형점이 제곱을 택하게 했다.

07실험실 — 자료 입력해 보기

Interactive variance calculator

자료를 쉼표로 구분해 입력

08개념 점검 5문항

Quick check
QC 01
자료 $2, 4, 6, 8, 10$ 의 평균은?
정답 보기
$\bar{x} = 30/5 = \mathbf{6}$.
QC 02
위 자료의 편차들을 나열하라.
정답 보기
$2-6, 4-6, 6-6, 8-6, 10-6 = \mathbf{-4, -2, 0, 2, 4}$.
QC 03
위 편차들의 합은?
정답 보기
$-4-2+0+2+4 = \mathbf{0}$. (편차의 합은 항상 0)
QC 04
위 자료의 분산은?
정답 보기
편차 제곱 합 $=16+4+0+4+16=40$. 분산 $= 40/5 = \mathbf{8}$.
QC 05
위 자료의 표준편차는?
정답 보기
$s = \sqrt{8} = \mathbf{2\sqrt{2}}$.

09예제 2선

Worked examples
예제 1 · 단계별 계산

자료 $5, 7, 9, 11, 13$ 의 분산과 표준편차를 구하여라.

STEP 1 · 평균 $\bar{x} = 45/5 = 9$.
STEP 2 · 편차: $-4, -2, 0, 2, 4$. (합 $=0$ ✓)
STEP 3 · 편차 제곱: $16, 4, 0, 4, 16$. 합 $=40$.
STEP 4 · 분산 $s^2 = 40/5 = 8$. 표준편차 $s = 2\sqrt{2}$.
$s^2 = 8, \; s = 2\sqrt{2}$
예제 2 · 미지수가 포함된 자료

자료 $x, 4, 6, 8, 12$ 의 평균이 $7$ 일 때 표준편차를 구하여라.

평균 조건 · $\dfrac{x+30}{5} = 7$ → $x = 5$.
편차 · 자료 $5, 4, 6, 8, 12$ 의 편차 $= -2, -3, -1, 1, 5$. (합 0 ✓)
편차 제곱 합 · $4+9+1+1+25 = 40$.
분산·표준편차 · $s^2 = 40/5 = 8$, $s = 2\sqrt{2}$.
$s = 2\sqrt{2}$

10연습 8문항

Practice · ★ basic / ★★ standard / ★★★ challenge
P01
자료 $1, 2, 3, 4, 5$ 의 평균은?
풀이 보기
$\bar{x} = 15/5 = 3$.
P02
자료 $1, 2, 3, 4, 5$ 의 분산은?
풀이 보기
편차 $-2, -1, 0, 1, 2$. 제곱 합 $4+1+0+1+4=10$. 분산 $= 10/5 = 2$.
P03
자료 $1, 2, 3, 4, 5$ 의 표준편차는?
풀이 보기
$s = \sqrt{2}$.
P04★★
자료 $3, 5, 7, 9, 11$ 의 분산은?
풀이 보기
평균 $7$. 편차 $-4, -2, 0, 2, 4$. 제곱 합 $40$. 분산 $8$.
P05★★
자료 $7, 8, 9, 10, 11$ 의 표준편차는?
풀이 보기
평균 $9$. 편차 $-2, -1, 0, 1, 2$. 제곱 합 $10$. 분산 $2$. 표준편차 $\sqrt{2}$.
P06★★
자료 $X = \{1, 2, 3, 4, 5\}$ 와 $Y = \{1, 3, 5, 7, 9\}$ 중 표준편차가 더 큰 자료는? ($X$ 또는 $Y$)
풀이 보기
$X$: 분산 $2$, 표준편차 $\sqrt{2}$. $Y$: 평균 5, 편차 $-4,-2,0,2,4$, 분산 $40/5=8$, 표준편차 $2\sqrt{2}$. 따라서 $Y$ 가 더 큼. ($Y$ 의 값들이 더 흩어져 있음.)
P07★★★
5개 자료의 평균이 $8$, 분산이 $6$ 이다. 5개 자료의 제곱의 합 $\sum x_i^2$ 는?
풀이 보기
분산의 또 다른 공식 $s^2 = \dfrac{1}{n}\sum x_i^2 - \bar{x}^2$. $6 = \dfrac{1}{5}\sum x_i^2 - 64$ → $\dfrac{1}{5}\sum x_i^2 = 70$ → $\sum x_i^2 = 350$.
P08★★★
자료 $x, 4, 6, 8, 12$ 의 평균이 $7$ 일 때, 이 자료의 표준편차는?
풀이 보기
평균 조건: $x+30 = 35$ → $x=5$. 자료 $5,4,6,8,12$. 편차 $-2,-3,-1,1,5$. 합 $0$ ✓. 제곱 합 $4+9+1+1+25=40$. 분산 $8$. 표준편차 $2\sqrt{2}$.

11한 줄로 정리

Synthesis

편차

$d_i = x_i - \bar{x}$. 자료가 평균에서 얼마나 떨어졌나. 합은 항상 0.

분산

$s^2 = \tfrac{1}{n}\sum(x_i - \bar{x})^2$. 편차 제곱의 평균. 단위는 자료의 제곱.

표준편차

$s = \sqrt{s^2}$. 분산의 제곱근. 자료와 같은 단위.

4단계 절차

평균 → 편차 → 편차 제곱 합 → ÷n (분산) → √ (표준편차).

다음 단계 — Ⅵ-2.3 산점도와 상관관계  지금까지 다룬 것은 한 변수의 자료. 이제 두 변수의 짝을 다룬다. 키와 몸무게, 공부 시간과 점수 — 두 변수가 함께 변할 때 그 관계를 어떻게 시각화하고 측정하는가?